DiscoverExplAInable[142] השקרים שUMAP מספר לנו
[142] השקרים שUMAP מספר לנו

[142] השקרים שUMAP מספר לנו

Update: 2025-12-08
Share

Description

למה תמיד כשאנחנו משתמשים בUMAP, קלאסטרים עם אותה כמות נקודות נראים באותו הגודל?

השבוע ב-explAInable, מייק והילה צללו לשיטת הויזואליזציה UMAP, שנחשבת לחדשנית ביותר בתחום ומשמשת רבים מאיתנו בהדמיה של נתונים ממימד הגבוה למרחב הטלה של דו-מימד (או תלת-מימד). ניתחנו את משמעות השם של השיטה, ובדקנו איך הנחת התפלגות האחידה שלנו המהווה את הבסיס להטלה במימד הנמוך יכולה לשבש לנו את התוצאות.

האם אנחנו באמת יכולים לסמוך על צפיפות הנקודות במרחב ההטלה, האם יכול להיות שאנומליות ימסו לנו לקלאסטרים המרכזיים? כל זאת ועוד - בפרק!

לינק לקוד הפתוח של UMAP, שכולל הטמעה של densMAP: 

https://github.com/lmcinnes/umap

לינק למאמר של UMAP בארכיב (עדכון אחרון של המאמר ב-2020):

https://arxiv.org/abs/1802.03426

בואו להתארח אצלנו כמומחים בפרקים הבאים:

https://forms.gle/JQM2zTmeY6cp58AA9

פרקים

00:00 מתי קווים מקבילים יפגשו?

00:51 היי UMAP, שמור לי על שכנים קרובים ונקודות רחוקות בבקשה!

02:26 החשיבות העסקית של ויז׳ואליזציות בעלות משמעות

03:19 עושים decoding לשם השיטה. 

04:55 איך UMAP עובד מתמטית

07:54 אוי לא, הנחת ההתפלגות האחידה מסבכת אותנו!

08:46 האם הויזואליזציות שאנחנו מייצרים משקרות לנו?

11:00 שיפורים של UMAP להתמודדות עם צפיפות משתנה



Comments 
In Channel
loading
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

[142] השקרים שUMAP מספר לנו

[142] השקרים שUMAP מספר לנו

Tamir Nave, Mike Erlihson & Uri Goren